凭空想象画个穿着汉服的蚁人，人工智能吓着我了

来源：互联网作者：王林更新时间：2021-05-31 15:59:36阅读：

假如让人工智能根据你的描述画一张画，你猜它能多“离谱”，比如我写了一个：穿着汉服的蚁人，也许你想象中的图是下图这样的，可是，你要知道，人工智能从来不走寻常路，所以你猜AI画出来的样子是什么样的？

关于AI画画这种人工智能应用，现在诞生的项目不是一种两种了；目前网上公开的技术资料和科研成果已有几款人工智能生成模型接口开放和测试。而且在技术平台也有开源的代码托管。虽然AI画画处理的是数字像素图像领域，不过实际上，还涉及到自然语言处理等问题。毕竟你让人工智能应用画画，总要用语言告诉它画什么才行，另外从技术上说，NLP也必不可少。所以机智客在此次谈及的AI画画，往往是从文本描述生成图像的问题。

而说到从文本描述生成图像，可能我们很多人会想到OpenAI的模型DALL·E，它的确强大，让我们很多人觉得惊艳，不过正如很多技术应用一样，它并不支持我们的母语汉字中文，也就是说，你想测试使用时，你不能直接使用中文，得用英语或翻译才行。

而现在，“中文版的Dall·E”来了，这就是清华大学唐杰团队打造的CogView，一个带有VQ-VAE分词器40亿参数的Transfomer。瞧，是Transfomer呢。所以，CogView的主干是一个单向Transformer，共有48层、40个注意力头、40亿参数，隐藏层的大小为2560。不过，清华大学唐杰团队的CogView在MS COCO实现了最低的FID，其性能优于以前基于GAN的模型和以及类似的Dall·E。这个“会画画的AI”更适合我们国人尝鲜。

毕竟，清华大学唐杰团队也开放了测试。我们只要输入简体中文文本描述，其他的交给就行了。而这个根据文字描述生成图片的人工智能怎么样呢，机智客抱着好奇的心态去试了试。需要一句文本描述，想了下，输入：穿着汉服的蚁人。原本以为一提交就出结果，结果天真了。原本以为穿着汉服的蚁人应该是如下图这样，当然即便不太想，也应该有那么一点点意思，结果，还是天真了。

第一个天真，是因为一提交，即反馈结果，排队列表（当前数量： 20）。看样子是测试的人多，我们提交后还需要排队等待出结果。那就等呗，等的时间做别的事。等再回想起来，刷新了也没看到主页有那个图。看看页面中的查看历史有别的，之后再刷新才找到。而第二个天真，则是看到已经被AI把我描述的图“画出来”的样子。让人倍感诡异，相当惊悚。

乍一看，这个挺瘆人。阴森黑暗的室内背景（像是）中，整个格调都是深蓝幽暗的神秘样子。偏偏前景C位是一个长得像是女人的白衣人。明暗对比，惨白夹杂着浅黄的服饰，配着浅黄到白的长发，空洞到黑的双眼，身躯直挺挺站立着，直溜地仿佛人在悬空而立。这是人？哇，这是什么鬼？说好了的蚁人呢，说好了的汉服呢？这是在逗我还是在吓我？

不过呢，机智客第一眼看到后，心里的确小小一惊，然后就哑然失笑了。没错，是AI味儿。的确，我们要画某个画，往往都是以先有经验为模板，而人工智能往往没有这个“偏见”。当然这只是其一，更重要的是，机智客觉得，现在的人工智能，当然还没发展到设计绘画出来的东西有绝对意义，还没发展到替代我们人类设计师、工程师和创作者的阶段。我们还没硅基的人类，在机器和数字化的世界里，可以继续生存。

标题：凭空想象画个穿着汉服的蚁人，人工智能吓着我了

地址：http://ai.rw2015.com/keji/9028.html

免责声明：人工智能网为网民提供实时、严谨、专业的财经、产业新闻和信息资讯，更新的内容来自于网络，不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系站长，本网站将立即予以删除！。

上一篇：宝信软件：公司将结合大数据和人工智能等技术为企业提供技术支撑

下一篇：【直播预告】2021第二届中国人工智能创新大赛机器人智慧物流赛的培训来了！

人工智能网推荐浏览

高瓴人工智能学院博士后获中国博士后科学基金特别资助

美军首次给U2侦察机装上人工智能全权接管该机两大关键系统

人工智能视觉算法商城「极视角」完成C1轮融资

赶上人工智能发展大潮，这只ETF就够了？

AI独角兽商汤科技西安研究院落成启动，构建西北地区人工智能产

人工智能公司Rokid发布新双目混合现实眼镜